INRIA团队:如何让AI理解复杂空间关系生成图像?
在2025年5月,法国国家信息与自动化研究所(INRIA)、巴黎高等师范学院和法国国家科学研究中心(CNRS)的研究团队 Zeeshan Khan、Shizhe Chen 和 Cordelia Schmid 联合发布了一项令人瞩目的研究成果:ComposeAn
在2025年5月,法国国家信息与自动化研究所(INRIA)、巴黎高等师范学院和法国国家科学研究中心(CNRS)的研究团队 Zeeshan Khan、Shizhe Chen 和 Cordelia Schmid 联合发布了一项令人瞩目的研究成果:ComposeAn
图像风格化旨在通过风格化模型,将一幅图像在保持语义内容不变的同时从一种风格转换到另一种风格。近年随着扩散模型的出现,主流图像风格化方法从基于深度神经网络,转向了通过低秩适配(Low-Rank Adaptation, LoRA)微调的方法,并结合图像一致性模块,
风格化 图像 rtx omniconsistency 图像风 2025-06-05 21:21 7
卡斯帕·大卫·弗里德里希是德国浪漫主义的代表风景画家之一,有着枯败生命姿态的橡树图像贯穿了他一生的创作,但目前学界尚缺乏对其橡树图像的系统研究。本文将在“危机时代”的语境下,运用图像学与文献研究法,梳理弗里德里希笔下“英雄式”橡树图像生成的历史脉络;综合19世
德国雷根斯堡大学科学史教授奥马尔·纳西姆(Omar W. Nasim)的《天文学家的椅子:19世纪的科学、设计与视觉文化》(The Astronomoer’s Chair: A Visual and Cultural History,2021;高旭东译,中信出
近期小行深刻感受到图像生成正经历一场“技术革命”。从Black Forest Labs发布的FLUX.1 Kontext模型实现像素级图像编辑,到OpenAI图像生成API新增实时流式预览与多轮编辑功能,技术突破正不断刷新创作效率上限。更值得关注的是,开源社区
在使用图像识别的世界里,你是否曾想过:人工智能是如何"看"图片的?当你的手机识别出照片中的猫咪,或者自动驾驶汽车识别出道路标志时,背后发生了什么?今天,我们要聊一项来自加州大学伯克利分校的有趣研究,它可能会改变我们构建这些视觉模型的方式。
在城市基础设施的地下世界里,地埋高压线缆、燃气管道、通信光缆等如同城市的 “地下脉络”,承载着能源输送、信息传递等关键功能,维系着城市的正常运转。然而,自然灾害的侵袭、重物堆积的压力、违章施工的破坏,时刻威胁着这些地下设施的安全,一旦发生地埋线缆扭曲、变形甚至
行业主要上市公司:阿里巴巴 ( 09988.HK,BABA.US ) ; 百度 ( 09888.HK,BIDU.US ) ; 腾讯 ( 00700.HK, TCEHY ) ;科大讯飞 ( 002230.SZ ) ;万兴科技 ( 300624.SZ ) ;三六零
第二条本条例所称公共安全视频图像信息系统(以下简称公共安全视频系统),是指通过在公共场所安装图像采集设备及相关设施,对涉及公共安全的区域进行视频图像信息收集、传输、显示、存储的系统。
你唯一能听到的声音就是风的低语。这里没有拥挤的人群,也没有什么喧嚣(除非你碰巧被困在火星狂野的全球沙尘暴中)。然而,毅力号从杰泽罗陨石坑的孤寂有利位置拍摄的一张新照片,似乎传达了火星上无与伦比的宁静。
FLUX.1 Kontext 是来自 Black Forest Labs 的一款新图像编辑模型。它是用于通过文本提示编辑图像的最佳模型之一,并且是 FLUX.1 家族的最新成员。
不久前,GPT-4o 的最新图像风格化与编辑能力横空出世,用吉卜力等风格生成的效果令人惊艳,也让我们清晰看到了开源社区与商业 API 在图像风格化一致性上的巨大差距。
民国教材封面的图像中,常常有象征现代生活的物品,如黑板、地球仪、收音机、火车、轮船等伴随儿童形象出现,这些物品或与教学活动相关,或与日常生活相关,体现出民国现代教育置身其间的现代化社会空间。以下从新式教具、现代电器两个方面解析民国封面儿童图像及其相关物品。
国家知识产权局信息显示,美服数字科技(广州)有限公司申请一项名为“一种基于人工智能的直播带货商品推送方法”的专利,公开号CN120075484A,申请日期为2025年02月。
近日,科技新闻界传来了一则关于Black Forest Labs(简称BFL)的创新消息。据悉,该公司推出了一款名为FLUX.1 Kontext的全新AI模型套件,专注于图像生成与编辑领域,且声称在速度上远超当前市场上的主流竞争对手。
国家知识产权局信息显示,中移(苏州)软件技术有限公司;中国移动通信集团有限公司申请一项名为“模型训练方法、图像重建方法、相关装置、设备、存储介质及计算机程序产品”的专利,公开号CN120070856A,申请日期为2025年01月。
科技媒体 WinBuzzer 昨日(5 月 30 日)发布博文,报道称 Black Forest Labs(BFL)推出全新 AI 模型套件 FLUX.1 Kontext,专注于生成与编辑上下文图像,号称速度比主流竞争对手快一个数量级。
在2025年5月28日发布的arXiv预印本论文《RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction》中,研究者提出了一种突破性的图
只能通过文字控制,无法灵活结合图片作为上下文;无法连续编辑或保留角色特征,缺乏“认知连续性”;局部编辑需要复杂遮罩或 finetuning;多轮操作后常常图像退化(失真、风格丢失);编辑速度慢,无法满足实时交互需求。
新模型FLUX.1 Kontext使用流匹配架构(Flow Matching),不再是文本编码器和扩散模型各干各的,与此前技术都不同。